class: title-slide, inverse, right, top background-image: url(data:image/png;base64,#02_img/logo-uc.png) background-position: 7% 13% background-size: 14%, cover <br> .right[ # Semana 3 ### <br> Introducción a Inferencia Causal ] <br> <br> <br> <br> .left[DCDPP - Datos para la evaluación de PolÃticas Públicas | PUC | 07 de octubre, 2022] <hr> .left[
<b>Pablo A. Celhay</b> | [
pacelhay@uc.cl](mailto:pacelhay@uc.cl) ] --- layout:true <div class="my-footer"> <span style="width:100%; text-align:center">
Semana 3|
<a href=mailto:pacelhay@uc.cl style="color: white"> pacelhay@uc.cl |
PUC-Escuela de Gobierno 2022</a> </span> </div> --- name: sl0 class: inverse middle animated, fadeIn #.pull-left[.center-l[Outline]] .pull-right[ .center-r[ .large[ 1. [¿Qué es la evaluación de impacto?](#evi) 2. [El modelo causal de Rubin](#rubin) 3. [El problema de selección](#selec) 4. [Regresión MCO](#mco) 5. [Experimentos](#exp) 6. [Variables Instrumentales](#vi) ]]] --- name: evi class: inverse middle center animated, fadeIn ## 1. ¿Qué es la evaluación de impacto? --- class: animated, fadeIn ## ¿Qué es la evaluación de impacto? <br> - La evaluación de programas es un concepto que abarca distintos tipos de evaluación: - La evaluación de la necesidad del programa - La evaluación de la lógica o el diseño de un programa - teorÃa de cambio - La evaluación de la implementación del programa - monitoreo - La evaluación de impacto del programa - evaluación de impacto - La evaluación de los costos y beneficios - análisis de costo beneficio - Este curso hablará de todo esto pero se concentra en evaluación de impacto --- class: animated, fadeIn ## ¿Por qué hacemos evaluaciones de impacto? <br> - Enormes recursos destinados a mejorar resultados: Gasto en Salud, Educación, Vivienda, PolicÃa, etc. -- .center[Pero, **hacen alguna diferencia**?] -- - Los objetivos de una evaluación de programa son: - Determinar si los programas son efectivos - Proveer "rendición de cuentas" (accountability) a organizaciones que crean estos programas - Mejorar programas a futuro en base a lecciones aprendidas. --- class: animated, fadeIn ## Evaluación de programa: Ejemplo **Expansión de redes de agua y saneamiento en Bolivia (BID 2015)** <img src="data:image/png;base64,#02_img/figura_agua.png" width="50%" style="display: block; margin: auto;" /> --- class: animated, fadeIn ## Evaluación de programa: Ejemplo **Expansión de redes de agua y saneamiento en Bolivia (BID 2015)** - Problema: ".... Según datos del Censo 2012, el acceso a agua por cañerÃa de red es del 68,3% de los hogares a nivel nacional, pero sólo del 40,3% en zonas rurales. El censo también reporta que mientras el 30,1% de los hogares de todo el paÃs carece de servicio sanitario de baño o letrina, en zonas rurales la cifra aumenta al 62,4%. Por otro lado, la defecación al aire libre es del 46% en zonas rurales versus un 4% en zonas urbanas" (BID 2016) -- - Programa: ".... programa de agua y saneamiento (AyS) focalizado en comunidades rurales cuya población sea inferior a 500 habitantes con el objeto de: i) aumentar la cobertura de AyS en estas comunidades, ii) reducir el riesgo de enfermedades de origen hÃdrico en niños menores 5 años, iii) disminuir las prácticas de defecación al aire libre, y iv) mejorar la productividad de los adultos en hogares que dedican un promedio de 3 horas diarias a tareas de recolección y acarreo de agua" (BID 2016) --- class: animated, fadeIn ## Evaluación de programa: Ejemplo **Expansión de redes de agua y saneamiento en Bolivia (BID 2015)** - El Banco InterAmericano del Desarrollo (BID) realizó (y está realizando) una evaluación de impacto del AyS en Bolivia. - Implementó un experimento aleatorio en donde un grupo de comunidades fueron intervenidas y otras no, en el año 2016 - Han analizado la implementación en detalle - Midiendo variables de consumo de agua, cambio de hábitos (higiene), y salud, con datos antes y después de la implementación. -- - Es uno de los primeros estudios a gran escala de AyS en Latinoamérica: - Pero, ¿porqué realizaron un experimento aleatorio? - ¿Cómo deberÃamos interpretar sus resultados? - ¿Qué métodos se podrÃan haber utilizado de no haber aleatorización? - ¿Qué supuestos están detrás de estos métodos? -- - Estas preguntas resumen nuestro semestre a venir. --- class: animated, fadeIn ## Resultados vs. Impacto - Comencemos por una terminologÃa básica que utilizamos en evaluación de impacto. Es importante distinguir entre variables de resultado e impactos -- - Variables de resultados: cosas que podemos (potencialmente) medir: -- - Resultados de tests estandarizados (simce) - Salarios - Edad en el primer nacimiento - Muertes por accidentes -- - Impactos: cambios en variables de resultado atribuibles o causados por un programa o polÃtica pública: -- - Cambio en Simce luego de un programa de capacitación docente - Cambio en salarios luego de ir a la Universidad - Cambio en la edad en el primer nacimiento debido a una polÃtica de anticonceptivos - Cambio en muertes por accidentes debido a una mayor regulación de maneja bajo alcohol --- name: evi class: inverse middle center animated, fadeIn ## 2. El modelo causal de Rubin --- class: animated, fadeIn ## El modelo causal de Rubin (1974) - Suponga que: - Hay `\(N\)` personas, `\(i = 1,...,N\)` - Son seleccionadas de manera aleatoria de una población - Queremos estimar el efecto de una variable binaria de tratamiento, `\(D_i\)`, sobre `\(Y_i\)` **¿cómo lo hacemos?** -- - Digamos que hay dos resultados potenciales para cada observación: - `\(Y_{0i}\)` = resultado para `\(i\)` bajo control - `\(Y_{1i}\)` = resultado para `\(i\)` bajo tratamiento - ¿Qué observamos en nuestros datos? -- No podemos observar `\(Y_{0i}\)` e `\(Y_{1i}\)` para el mismo `\(i\)` -- - Pero teóricamente, definimos el efecto causal de `\(D_i\)` sobre `\(Y_i\)` como: `$$\tau_i = Y_{1i}-Y_{0i}$$` --- class: animated, fadeIn ## El modelo causal de Rubin (1974) `$$\tau_i = Y_{1i}-Y_{0i}$$` - Notar: 1. El efecto del tratamiento se define siempre en términos relativos -- **¿A qué?** -- 2. El efecto del tratamiento no necesariamente es el mismo para todos los `\(i\)` -- **¿Por qué?** -- 3. Nunca observamos `\(Y_{1i}, Y_{0i}\)` para el mismo `\(i\)` -- **¿Por qué?** -- - Esto se conoce como el problema fundamental de la inferencia causal (Holland 1986) - Imposible observar el valor `\(Y_{1i}, Y_{0i}\)` en la misma unidad `\(i\)` -- - ¿Podemos estimar entonces `\(\tau_i\)`? -- - ¿Entonces para qué hacemos este curso? --- class: animated, fadeIn ## El efecto tratamiento promedio (ATE) - Se puede estimar el efecto de tratamiento promedio (ATE) - Definamos ATE: `$$\begin{align*} \tau^{ATE} & = E[Y_{1i}- Y_{0i}] \\ & = E[Y_{1i}] - E[Y_{0i}] \end{align*}$$` - En evaluación de impacto queremos estimar este parámetro de datos que incluyan: - Personas que recibieron el programa - Personas que no recibieron el programa -- - ¿Podemos estimar ATE de estos datos? --- class: animated, fadeIn ## El problema de la evaluación **Ejemplo: Cursos de manejo llevan a mayores choques** En Agosto del año 2010, en un paÃs se legisla para que los conductores de auto tengan mayor precaución y se exigen cursos de manejo. <img src="data:image/png;base64,#02_img/figura_car.png" width="50%" style="display: block; margin: auto;" /> --- class: animated, fadeIn ## El problema de la evaluación **Ejemplo: Cursos de manejo llevan a mayores choques** En Agosto del año 2010, en un paÃs se legisla para que los conductores de auto tengan mayor precaución y se exigen cursos de manejo. - El argumento de los(as) legisladores era el siguiente: "un estudio reciente muestra que, en la población menor a 18 años, personas que tomaron el curso de manejo tienen una probabilidad de chocar cuatro veces mayor al compararlas con aquellas que no tomaron el curso" -- - Esto efectivamente fue asÃ. Los datos mostraban que alrededor del 5% de los(as) adolescentes que tomaron el curso de manejo reportaron tener algún accidente comparado con solo 1% de aquellos(as) que no lo hicieron. -- - **Discusión grupal**: Preguntas acerca de la interpretación de estos datos: - Esta conclusión ¿es correcta necesariamente? - ¿Cuáles son los supuestos necesarios para legar a esta discusión? - ¿Porque no son creÃbles estos supuestos? --- class: animated, fadeIn ## El estimador ingenuo - La diferencia simple de medias observadas para personas tratadas y no tratadas se llama el estimador ingenuo (Naive estimator) del efecto del programa: `$$\tau^{N} = E[Y_{1i}|T]- E[Y_{0i}|C]$$` -- - ¿Qué significan estas esperanzas condicionales? -- - `\(E[Y_{1i}|T]\)`: -- Promedio del resultado bajo tratamiento para la persona `\(i\)` en el grupo de tratamiento - `\(E[Y_{0i}|C]\)`: -- Promedio del resultado bajo control para la persona `\(i\)` en el grupo de control -- - ¿Algunas preguntas? - ¿Podemos observar ambos términos `\(E[Y_{1i}|T]\)` y `\(E[Y_{0i}|C]\)`? -- - Recuerden a ATE: `\(E[Y_{1i}] - E[Y_{0i}]\)` -- - El estimador ingenuo, ¿nos entrega ATE? --- class: animated, fadeIn ## El estimador ingenuo `$$\tau^{N} = E[Y_{1i}|T]- E[Y_{0i}|C]$$` -- - Recordemos la definición de ATE: `$$\tau^{ATE} = E[Y_{1i}] - E[Y_{0i}]$$` -- - Usar el estimador ingenuo para obtener ATE asume entonces: -- - `\(E[Y_{1i}]=E[Y_{1i}|T]\)` - `\(E[Y_{0i}]=E[Y_{0i}|C]\)` -- - ¿Cómo interpretamos estos supuestos? -- - Lo llamaremos ingenuo porque ignora el **problema de selección** --- name: selec class: inverse middle center animated, fadeIn ## 3. El problema de selección --- class: animated, fadeIn ## El problema de selección <br> - Este es el problema más grande que tenemos en evaluación de impacto - El problema de selección se genera principalmente porque sólo podemos observar algunas personas bajo tratamiento - Las personas que participan en un programa son diferentes a aquellas que no participan - Las personas que participan en un programa son también diferentes a si mismas previo al inicio del programa --- class: animated, fadeIn ## El problema de selección <br> - La pregunta clave detrás del problema de selección es: Porqué estas personas fueron tratadas y otras no? -- - Bajo el problema de selección, los supuesto detrás del estimador ingenuo son cuestionables: Los resultados para los individuos no tratados son probablemente un mal estimador del estado contrafactual de estos mismos individuos -- - Pregunta: ¿Por qué los conductores que no recibieron el curso son una mala comparación para aquellos que si lo recibieron? --- class: animated, fadeIn ## Dos tipos de selección <br> - **Selección en Observables**: Participantes son diferentes a los no participantes en caracterÃsticas observables, i.e. edad o nivel de educación. Estas caracterÃsticas son medibles y por eso las llamamos observables. -- - **Selección en No-Observables**: Participantes son diferentes a los no participantes en caracterÃsticas no observables, i.e. aversión al riesgo, habilidad inherente, motivación. En general no tenemos o no podemos medir estas variables y tenerlas en nuestros datos. -- - Las caracterÃsticas pueden ser observables y no observables dependiendo del contexto y la base de datos que tengamos. --- class: animated, fadeIn ## Este curso estudia métodos para estos problemas de selección - El estimador ingenuo tiene supuestos fuertes que no se sostienen y son comunes - Comparar un mismo grupo antes y después del programa - Comparar en un mismo periodo personas en distintos grupos -- - ¿Qué métodos utilizar para poder corregir este problema? -- - Piensen en el caso del curso de manejo y sus efectos en la tasa de accidentes de tránsito? - Ya discutimos que el estimador ingenuo no nos sirve - ¿Qué métodos habrÃa que proponerles a los legisladores para que saquen mejores conclusiones? --- class: animated, fadeIn ## Panorama <br> - Selección en observables - MCO - Matching y Propensity Score Matching - Selección en No-observables - Experimentos - Datos de panel y diferencias en diferencias - Variables instrumentales - Regresión discontinua - Quizás ya los han escuchado pero entender bien estos métodos requiere práctica (talleres). --- name: mco class: inverse middle center animated, fadeIn ## 4. Regresión de MCO --- class: animated, fadeIn ## Volvamos a nuestra querida Regresión Lineal <br> - La regresión lineal que permite estimar efecto de un tratamiento sobre una variable de resultado es: `$$y_i = \beta_0 + \beta_1 D_i + \varepsilon_i$$` - `\(y_i\)`: es una variable de resultado (variable dependiente) - `\(D_i\)`: es una variable binaria (*dummy*) que es igual a 1 si la unidad de análisis (individuo, hogar, municipio, paÃs) participa o recibe un programa y 0 en caso contrario. - `\(\varepsilon_i\)`: es un error que se distribuye i.i.d. (supuesto) -- - ¿Cómo se estima `\(\beta_1\)`? -- ¿Cuáles son los supuestos de MELI? --- class: animated, fadeIn ## Una forma de ver el problema de selección en nuestra regresión lineal - ¿Cómo se estima `\(\beta_1\)`? -- ¿Cuáles son los supuestos de MELI? -- $$ `\begin{align*} \beta^{OLS}_1 & = E[y_i|D=1] - E[y_i|D=0] \\ & = E[ \beta_0 + \beta_1 + \varepsilon_i| D=1] - E[\beta_0 + \varepsilon_i|D=0]\\ & = \beta_1 + \underbrace{E[\varepsilon_i| D=1] - E[\varepsilon_i|D=0]}_{\text{selección}}\\ \end{align*}` $$ -- - ¿Qué nos dice `\(E[\varepsilon_i| D=1] - E[\varepsilon_i|D=0]\)`? --- class: animated, fadeIn ## Recordando la última clase <br> - Sea `\(D_i \in \{0,1\}\)` un indicator de si la persona `\(i\)` está bajo tratamiento o no. Si está bajo tratamiento, `\(D_i=1\)`, de lo contrario, `\(D_i=0\)`. Sea `\(Y_{1i}\)` la realización de la variable de resultado bajo tratamiento y `\(Y_{0i}\)` la realización de la variable de resultado sin tratamiento. Entonces el impacto para la persona `\(i\)` se define como: `$$\Delta_i = Y_{1i} - Y_{0i}$$` -- - ¿Cuál es el problema fundamental aquÃ? -- `\(\rightarrow\)` El problema fundamental de la evaluación es que no observamos el contrafactual `\(Y_{0i}\)` para aquellas personas que están bajo tratamiento, y tampoco observamos `\(Y_{1i}\)` para aquellas personas que están sin tratamiento --- class: animated, fadeIn ## ¿Qué son los parámetros de tratamiento? <br> - La mayorÃa de los enfoques a la evaluación en ciencias sociales parten del hecho que no podemos calcular `\(\Delta_i\)` a nivel individual - Por lo que intentamos estimar alguna función de `\(\Delta_i\)` -- (hint: el promedio es una función) -- - Pero no es claro qué parámetro vamos a estimar - Tampoco para qué población vamos a estimar este parámetro `\(\rightarrow\)` Depende mucho de la pregunta que queramos responder - Todo esto tendrá más sentido en las próximas clases pero es bueno tenerlo en mente --- class: animated, fadeIn ## ¿Qué queremos saber de un programa? **Heckman, Lalonde, Smnith (1999)** - La proporción de la población que se beneficiarÃa del programa: -- `\(\rightarrow\)` Si tuviésemos `\(\Delta_i\)`, ¿cómo se construye? `$$Pr(\Delta_i>0)$$` - La proporción de los tratados que se beneficia del programa: `$$Pr(\Delta_i>0|D=1)$$` - La complejidad de estos parámetros es que requiere que sepamos la distribución de los efectos del programa, `\(F(\Delta_i)\)` y la distribución de los efectos del programa sobre las personas que toman el programa `\(F(\Delta_i|D=1)\)`. --- class: animated, fadeIn ## ¿Qué podemos estimar comúnmente? - La literatura y la práctica se enfoca en estimar efectos promedio -- - Efecto promedio del programa (ATE) `$$\Delta^{ATE} = E(\Delta_i) = E(Y_{1i} - Y_{0i})$$` -- - Efecto promedio del programa sobre los tratados (ATET) `$$\Delta^{ATET} = E(\Delta_i | D=1) = E(Y_{1i} - Y_{0i} | D=1)$$` -- - Efecto promedio del programa sobre los no tratados (ATEN) `$$\Delta^{ATEN} = E(\Delta_i | D=0) = E(Y_{1i} - Y_{0i} | D=0)$$` --- class: animated, fadeIn ## Todos estos parámetros pueden responder preguntas claves de polÃtica públicas - Por ejemplo, consideremos un gobierno que quiere entregar bonos para que las madres lleven a sus hijas al control de la niña sana. Pero no todas las beneficiarias toman el programa: -- `\(\rightarrow\)` ¿Es esto común?¿Personas elegibles a un programa no toman el programa?¿Por qué?¿Son distintas estas personas de las que si toman el programa? -- - Sea la población de interés todas las niñas y niños que pertenecen al 50% más pobre de los hogares de Chile. Sea `\(D_i=1\)` un indicador de si la madre `\(i\)` recibe el bono y los resultados potenciales `\(Y_{1i}, Y_{0i}\)` el IMC de la niña: - ¿Cuándo quisiéramos estimar `\(\Delta^{ATET}\)`? - ¿Cuándo quisiéramos estimar `\(\Delta^{ATE}\)`? - ¿Cuándo quisiéramos estimar `\(\Delta^{ATEN}\)`? - ¿EsperarÃamos que estos parámetros difieran? --- class: animated, fadeIn ## Todos estos parámetros pueden responder preguntas claves de polÃtica públicas - Si es que los impactos son los mismos para todas las personas entonces se dice que existen efectos homogéneos y todos los parámetros que vimos son equivalentes - Pero en general estos parámetros difieren entonces los efectos del programa son heterogéneos: `\(\rightarrow\)` `\(\Delta^{ATET}\neq\Delta^{ATE}\neq\Delta^{ATETN}\)` -- - Esto simplemente dice que el impacto del bono condicional puede ser distinto para personas que eligen tomarlo que para personas que no eligen tomarlo. -- - De todas formas estos parámetros se relacionan entre sÃ: `\(\rightarrow\)` `\(\Delta^{ATE} = Pr(D_i=1)\Delta^{ATET} + Pr(D_i=0)\Delta^{ATEN}\)` -- - ¿De donde viene esto? --- class: animated, fadeIn ## El efecto promedio sobre los tratados - En este curso nos enfocaremos en el ATET: `$$\Delta^{ATET} = E(\Delta_i | D=1) = E(Y_{1i} - Y_{0i} | D=1)$$` -- - Este parámetro consiste en dos promedios. El primero, `\(E(Y_{1i} | D=1)\)` lo podemos estimar de los datos observados ya que: `$$E(Y_{1i} | D=1) \approx \bar{Y}_{1,D=1}$$` - ¿Qué nos falta? -- La segunda parte del parámetro, el contrafactual (estado sin tratamiento) para la población que tomó el programa: `$$E(Y_{0i} | D=1) \approx ?$$` - Problema: No observamos esto para la persona `\(i\)` tratada: **Es el contrafactual que falta** --- class: animated, fadeIn ## Sesgo de selección en una asignación de tratamiento no aleatoria - Sigamos definiendo "sesgo de selección" (auto selección, selección en no observables, etc...) -- <img src="data:image/png;base64,#02_img/boring.jpg" width="40%" style="display: block; margin: auto;" /> --- class: animated, fadeIn ## Sesgo de selección en una asignación de tratamiento no aleatoria - Sigamos definiendo "sesgo de selección" (auto selección, selección en no observables, etc...) - Vamos a nuestro estimador ingenuo:\pause{} ¿Cómo lo armamos? \pause{} `$$\begin{align*} \Delta^{N} &= E(Y_{1i} | D=1) - E(Y_{0i} | D=0)\\ &= E(Y_{1i} | D=1) - E(Y_{0i} | D=0) + \underbrace{E(Y_{0i} | D=1) - E(Y_{0i} | D=1)}_{\text{agrego un} \;\;0} \\ &= E(Y_{1i} | D=1) - E(Y_{0i} | D=1) - E(Y_{0i} | D=0) + E(Y_{0i} | D=1) \\ &= \underbrace{E(Y_{1i} - Y_{0i} | D=1)}_{ATET} + \underbrace{E(Y_{0i} | D=1) - E(Y_{0i} | D=0)}_{\text{sesgo de selección}} \end{align*}$$` -- - `\(E(Y_{0i} | D=1) - E(Y_{0i} | D=0)\)` - ¿Cómo interpretamos esto? - ¿Es igual a cero este término? --- class: animated, fadeIn ## La parábola de Roy **Cómo la auto-selección lleva a `\(E(Y_{0i} | D=1) - E(Y_{0i} | D=0) \neq 0\)`}** - Suponga que hay solo dos profesiones en el mundo: economistas y contadores. Suponga que ambas profesiones son igualmente aburridas (atractivas). - Los salarios de contadores se distribuyen de la siguiente forma: `$$Y_{0i} \sim N(65,000; 5,000^{2})$$` - Los salarios de economistas se distribuyen de la siguiente forma: `$$Y_{1i} \sim N(60,000; 10,000^{2})$$` - También asumimos que hay una correlación entre profesiones de 0.84, alta. Esto sólo quiere decir que si alguien va a ser buena economista es probable que también sea una buena contadora. --- class: animated, fadeIn ## Hagamos un modelo simple <br> - Suponga que ningún individuo tiene una preferencia muy grande sobre alguna de estas profesiones. Ella elige la que paga más. -- ¿Qué observamos entonces para cada `\(i\)`? -- `$$y_{i} = max(y_{0i},y_{1i})$$` - Sea `\(D_i=1\)` si es que esta persona elige economÃa. -- ¿Porqué elegirÃa economÃa? -- probablemente para esta persona `\(y_{1i}>y_{0i}\)` - Asumamos que observamos los salarios potenciales de toda la población --- class: animated, fadeIn ## Hagamos un modelo simple Luego de varias simulaciones obtenemos lo siguiente: <table> <thead> <tr> <th style="text-align:left;font-weight: bold;color: white !important;background-color: #586CC4 !important;"> </th> <th style="text-align:center;font-weight: bold;color: white !important;background-color: #586CC4 !important;"> Contadores </th> <th style="text-align:center;font-weight: bold;color: white !important;background-color: #586CC4 !important;"> Economistas </th> <th style="text-align:center;font-weight: bold;color: white !important;background-color: #586CC4 !important;"> Todas </th> </tr> </thead> <tbody> <tr> <td style="text-align:left;background-color: white !important;"> Salarios de contadores </td> <td style="text-align:center;background-color: white !important;"> <span style=" color: blue !important;">63.985</span> </td> <td style="text-align:center;background-color: white !important;"> 68.69 </td> <td style="text-align:center;background-color: white !important;"> 65.001 </td> </tr> <tr> <td style="text-align:left;background-color: white !important;"> Salarios de economistas </td> <td style="text-align:center;background-color: white !important;"> <span style=" color: blue !important;">72.317</span> </td> <td style="text-align:center;background-color: white !important;"> 72.317 </td> <td style="text-align:center;background-color: white !important;"> 59.992 </td> </tr> </tbody> </table> -- - ¿Qué observamos en la práctica? -- Los números azules (la realización de la variable de resultado) -- - Suponga que queremos saber el efecto causal de elegir la economÃa cómo profesión relativo a un contrafactual de elegir contabilidad - ¿Cuál serÃa el estimador ingenuo? - ¿Cuál serÃa el Efecto promedio de tratamiento (ATE)? --- class: animated, fadeIn ## Economistas vs. Contadores <br> - ¿Cuál es el ATE? -- `\(\Delta^{ATE} = E[Y_{1i} - Y_{0i}]=59.992 - 65.001 = -5,009\)` - ¿Cuál es la respuesta usando el estimador ingenuo? -- `\(\Delta^{N} = E[Y_{1i}|D_i=1] - E[Y_{0i}|D_i=0] = 72.317 - 63.985 = 8.332\)` - ¡Es el signo opuesto al `\(ATE\)`! -- ¿Porqué encontramos falsamente un efecto positivo? --- class: animated, fadeIn ## Economistas vs. Contadores - También podemos calcular la ganancia real de *ser economista* para aquellos que *eligieron economÃa* `\(\Delta^{ATET} = E[Y_{1i} - Y_{0i}|D=1]= 72.317 - 68.690 = 3.627\)` -- - Y alternativamente podemos calcular la ganancia real de \emph{ser economista} para aquellos que *eligieron contabilidad* `\(\Delta^{ATET} = E[Y_{1i} - Y_{0i}|D=0]= 56.599 - 63.985 = -7.386\)` -- - ¿Aquellas que eligieron ser contadores tomaron una buena o una mala decisión? -- Buena, ya que les hubiera ido peor siendo economistas -- - Importante: todos los parámetros aquà tiene su relevancia y el estimador ingenuo no nos entrega ninguno de ellos. --- class: animated, fadeIn ## Selección en el modelo de MCO - Podemos escribir el valor observado (realizado) de `\(Y_i\)` en términos de los resultados potenciales: -- `$$Y_{i} = D_i Y_{1i} + (1-D_{i})Y_{0i}$$` -- - Esto viene de el hecho que: `$$Y_{i} = Y_{1i} \;\; si \;\; D_i=1$$` `$$Y_{i} = Y_{0i} \;\; si \;\; D_i=0$$` - Ahora suponga que tenemos efectos de tratamiento que son homogéneos (es idéntico para toda la población): `$$\Delta_i= Y_{1i} - Y_{0i}=\delta$$` --- class: animated, fadeIn ## Selección en el modelo de MCO - Podemos escribir `$$\begin{align*} Y_{i} = &D_i Y_{1i} + (1-D_i)Y_{0i} \\ &= D_i Y_{1i} + Y_{0i} D_iY_{0i}\\ &= Y_{0i} + (Y_{1i}- Y_{0i})D_i + [E(Y_{0i}) - E(Y_{0i})]\\ &=E(Y_{0i}) + (Y_{1i}- Y_{0i})D_i + [ Y_{0i} - E(Y_{0i})]\\ &=\alpha + \delta D_i + \varepsilon_i \end{align*}$$` -- - Dónde: - `\(\alpha=E(Y_{0i})\)`: el promedio de `\(Y_{0i}\)` - `\(\delta=Y_{1i}- Y_{0i}\)`: el efecto promedio constante - `\(\varepsilon_i=Y_{0i} - E(Y_{0i})\)`: el componente aleatorio de `\(Y_{0i}\)` --- class: animated, fadeIn ## Selección en el modelo de MCO <br> - Ahora tomemos el valor esperado de `\(Y_i\)` condicional en `\(D_i=1\)` y condicional en `\(D_i=0\)`: -- `$$E[Y_{i} | D_i=1] = \alpha + \delta + E[\varepsilon_i | D_i=1]$$` `$$E[Y_{i} | D_i=0] = \alpha + E[\varepsilon_i | D_i = 0]$$` -- - Podemos escribir: `$$\begin{align*} \Delta^{N} &= E[Y_{i} | D_i=1] - E[Y_{i} | D_i=0] \\ &= \delta + E[\varepsilon_i | D_i=1] - E[\varepsilon_i | D_i = 0] \end{align*}$$` - ¿Es esta expresión familiar? ¿Lo podemos interpretar? --- class: animated, fadeIn ## Selección en el modelo de MCO <br> - Recuerden nuestro término de sesgo de selección: `$$E(Y_0i | D_i=1) - E(Y_0i | D_i=0)$$` -- - La nueva expresión `\(E[\varepsilon_i | D_i=1] - E[\varepsilon_i | D_i = 0]\)` es la misma selección pero expresada en términos del error en una regresión lineal -- - Si queremos obtener un estimador sin selección, necesitamos asumir entonces que el error es independiente del estado de tratamiento -- ¿Qué significa esto? -- - En el lenguaje de regresión: El error no esta correlacionado con la variable de tratamiento, `\(D_i\)` --- class: animated, fadeIn ## MCO y los parámetros de tratamiento <br> - Empecemos de un modelo muy general en donde los resultados potenciales son una función de las caracterÃsticas observadas, `\(X\)`, y las caracterÃsticas no observadas capturadas en el término de error, `\(\varepsilon\)`: `$$\begin{align*} Y_{1i} = g_1(X_i,\varepsilon_i) \\ Y_{0i} = g_0(X_i,\varepsilon_i) \end{align*}$$` -- - El primer supuesto es que estos dos términos son **separables** `$$\begin{align*} Y_{1i} = g_1(X_i,\varepsilon_i) = g_1(X_i) + \varepsilon_{1i} \\ Y_{0i} = g_0(X_i,\varepsilon_i) = g_0(X_i) + \varepsilon_{0i} \end{align*}$$` --- class: animated, fadeIn ## MCO y los parámetros de tratamiento <br> - Asumamos que la función `\(g(\cdot)\)` es \textcolor{blue}{lineal} en los parámetros: `$$\begin{align*} Y_{1i} = \beta_1X_i + \varepsilon_{1i} \\ Y_{0i} = \beta_0X_i + \varepsilon_{0i} \end{align*}$$` - También asumiremos que estas funciones de regresión tienen parámetros idénticos y sólo difieren por una constante según el estado de tratamiento `\(D_i\)`: `$$Y_{1i} = Y_{0i} + \delta$$` -- - Esto nos lleva a la regresión de MCO tÃpica: `$$Y_{i} = X_i\beta + \delta D_i + \varepsilon_i$$` --- class: animated, fadeIn ## MCO y los parámetros de tratamiento - ¿Qué supuestos necesitamos imponer en el error para poder estimar un efecto causal del tratamiento, `\(D_i\)`, sobre nuestra variable de resultado `\(Y_i\)`? -- - `\(E(\varepsilon)=\)` -- `\(0\)` -- - `\(E(\varepsilon|X_i)=\)` -- `\(E(\varepsilon)\)` -- - `\(E(\varepsilon|D_i)=\)` -- `\(E(\varepsilon)\)` -- - O, combinándolos todos: `\(E(\varepsilon|X_i,D_i)=E(\varepsilon)=0\)` -- - ¿Qué nos dice este supuesto? -- `\(E(\varepsilon|X_i,D_i)=0\)` implica que puede haber selección en observables `\(X\)`, pero que no hay selección en no observables, representados por `\(\varepsilon\)` --- class: animated, fadeIn ## Resumen <br> - A modo de resumen, la regresión: `\(Y_{i} = X_i\beta + \delta D_i + \varepsilon_i\)` -- - Impone la restricción de que: `\(\delta = \Delta_i\)`. El tratamiento es el mismo para todes - Asume que no hay selección en no obervables -- - ¿Qué pasa si es que estos supuestos no se cumplen? - Si los efectos son heterogéneos, el parámetro `\(\delta\)` es un promedio ponderado de los parámetros individuales - Si hay selección en no observables, el parámetro `\(\delta\)` nos entrega un estimador sesgado del impacto del programa. --- class: animated, fadeIn ## Repaso MCO <br> - Consideremos la regresión lineal de MCO: `$$Y_{i} = X_i\beta + \delta D_i + \varepsilon_i$$` -- - Bajo los supuestos anteriores y en particular bajo `\(E(\varepsilon|D,X)=0\)`, sabemos que el estimador de MCO nos entrega una estimación insesgada tal que `\(E(\hat{\delta})=\delta\)`. -- - `\(E(\varepsilon|D,X)=0\)` implica que podrÃa haber selección en observables, X, pero no selección en no observables, `\(\varepsilon\)`. --- class: animated, fadeIn ## ¿Cuándo incluir las X en la regresión? <br> Algunos tips para pensar en cuando incluir `\(X\)` en la regresión: 1. Si las Xs son afectadas por el tratamiento no hay que incluirlas pues estas deberÃan ser analizadas como variables de resultado `\((Y_i)\)` -- 2. Si las Xs pueden ser variables omitidas de la regresión deben ser incluidas porque de lo contrario podrÃan generar sesgo de variable omitida. -- 3. Incluir a las Xs también puede mejorar los errores estándar de los coeficientes (si mejoran el `\(R^{2}\)`). --- name: exp class: inverse middle center animated, fadeIn ## 5. Experimentos --- class: animated, fadeIn ## Lo que hay detrás de los experimentos Cuando el tratamiento es asignado de manera aleatoria, tenemos que: -- `$$F(X,\varepsilon | D=1) = F(X,\varepsilon | D=0) = F(X,\varepsilon)$$` -- ¿Qué significa esto? -- La distribución de caracterÃsticas observables y no observables para la población tratada y no tratada son iguales a la distribución de la población -- No hay diferencias sistemáticas entre un grupo y otro. -- No hay **sesgo de selección** por construcción --- class: animated, fadeIn ## Lo que hay detrás de los experimentos - Esto nos permite entonces al menos cumplir con algo muy importante para el análisis de impacto con regresión lineal -- `\(E(Y_{1i} | D=1) = E(Y_{1i} | D=0) = E(Y_{1i})\)` `\(E(Y_{0i} | D=0) = E(Y_{0i} | D=1) = E(Y_{0i})\)` -- - ¿Qué nos permite esta condición? \pause{} estimar ATE -- `$$\begin{align*} \Delta^{ATE} &= E(Y_{1i}) - E(Y_{i0})\\ &= E(Y_{1i} | D=1) = E(Y_{0i}| D=0) \end{align*}$$` -- - ¡Este es el estimador más sencillo que nos podemos imaginar! -- - El impacto es simplemente la diferencia entre promedios grupales --- class: animated, fadeIn ## Lo que se hace generalmente <br> - Verificar si la aleatorización funcionó -- - Revisar cuanta gente asignada al tratamiento efectivamente toma el tratamiento -- - Estimar el ATE (u otros parámetros) -- - Estimar efectos para distintas poblaciones --- class: animated, fadeIn ## King et al. (2009) <br> - Los sistemas de salud que promueven calidad en la atención no llegan a los sectores más vulnerables de la población - México implementa el Seguro popular en el año 2003 para garantizar cobertura financiera y acceso a servicios de salud - Objetivo principal es el de reducir el gasto catastrófico de bolsillo. -- Este es el gasto que incurrimos por sobre lo que el seguro paga - El SP paga a proveedores de salud acreditados `\(\rightarrow\)` Hospitales tienen incentivos a invertir para la acreditación --- class: animated, fadeIn ## Antes de ver el detalle - Pensemos junt@s la regresión que King deberÃa correr -- - ¿Cuál es la pregunta de impacto aquÃ? Principalmente, ¿Cuál es el efecto del SP en el gasto de bolsillo en salud? - ¿Qué datos necesitamos? -- - Con estos datos, ¿cómo escribimos la regresión para el análisis de impacto? -- - ¿Cómo estimamos esta regresión? -- ¿Qué supuestos hay detrás? -- - `\(y_i = \alpha + \delta D_i + \varepsilon_i\)` -- - ¿Qué es `\(y_i\)`? -- - ¿Qué es `\(i\)`? --- class: animated, fadeIn ## Diseño experimental <br> - ¿Porque aleatorizar este programa? -- - Implementación del SP -- 1. Problemas de presupuesto permiten dejar grupos fuera/esperando -- 2. Seguro popular se implementó cómo un "phased roll-out". ¿Qué significa esto? -- 3. ¿Cómo elegir cuáles comunidades entran primero? --- class: animated, fadeIn ## Diseño experimental <br> 1. "Matched pair cluster randomised trial" .red[¡¿QUÉ?!] -- 2. Definen geográficamente 12284 clusters ("catchment areas"). -- 3. 13 Estados del paÃs aceptan ser parte de la implementación: (5439 rurales y 1639 urbanos) -- 4. "Matched pair" en términos de tamaño y algunas caracterÃsticas observables. **¿Qué están tratando de hacer con esto?** -- 5. Luego obtienen información de 74 clusters en 7 Estados --- class: animated, fadeIn ## Estados que participan de estudio <img src="data:image/png;base64,#02_img/king1.png" width="75%" style="display: block; margin: auto;" /> --- class: animated, fadeIn ## Diseño experimental - Diseño 1. Con estos 74 clusters seleccionan uno al grupo de tratamiento y otro al grupo de control en cada par formado -- ¿Cómo lo harÃamos? -- - Tratamiento 1. Una campaña publicitaria masiva en comunidades de tratamiento para fomentar la inscripción en el SP 2. Personas ya inscritas en otros programas sociales (OPORTUNIDADES) se inscriben automáticamente 3. Por el lado de la oferta de salud, se inician los procedimientos para mejorar la calidad de la atención y el inventario de medicamentos -- - ¿A qué nivel es el tratamiento entonces? -- Tratamiento a nivel de comunidad -- - Grupo de control 1. "Business as usual". Recibe el mismo programa que siempre se ha recibido en Mexico pero espera un año para el SP. --- class: animated, fadeIn ## ¿Qué tan representativo el estudio de la población de México? **(Validez externa)** <img src="data:image/png;base64,#02_img/king2.png" width="60%" style="display: block; margin: auto;" /> --- class: animated, fadeIn ## Diseño experimental <br> - Diseño 1. Muestra final de 100 clusters - Se reduce principalmente porqué algunos Estados o lugares querÃan implementar más rápido el programa o porque algunos gobiernos locales no querÃan cooperar con el estudio. 2. Guerrero (8), Jalisco (2), Estado de México (54), Morelos (26), Oaxaca (4), San Luis Potosà (4), and Sonora (2). - Datos --- class: animated, fadeIn ## Estados que participan en el estudio <img src="data:image/png;base64,#02_img/king8.png" width="60%" style="display: block; margin: auto;" /> --- class: animated, fadeIn ## Diseño experimental <br> - Si la aleatorización funcionó, las caracterÃsticas del grupo de control y tratamiento deberÃan ser similares -- - Esto, ¿puede *testearse*? -- Al menos para caracterÃsticas observables se puede. Esto se conoce como "revisar balance" de la muestra -- - En el caso del SP, es complicado pues el tratamiento fue estratificado por Estado -- - Fue hecho al nivel de comunidad pero los datos son recolectados a nivel individual --- class: animated, fadeIn ## Diseño experimental <br> - Recuerde que la aleatorización hace que la distribución condicional de `\(Y_0\)` y de `\(Y_1\)` condicional en `\(D_i\)` sea igual a la distribución incondicional -- `\(E(Y_{1i} | D=1) = E(Y_{1i} | D=0) = E(Y_{1i})\)` `\(E(Y_{0i} | D=0) = E(Y_{0i} | D=1) = E(Y_{0i})\)` -- - ¿Qué nos permite esta condición? -- estimar ATE - Lo mismo se sostene para cualquier `\(X\)` -- `\(E(Y_{1i} | X) = E(Y_{1i})\)` `\(E(Y_{0i} | X) = E(Y_{0i})\)` - Por esta razón se reporta el "balance en las Xs". Por ejemplo mostrar `\(\hat{E[X_i]}\)` para cada grupo --- class: animated, fadeIn ## Datos <img src="data:image/png;base64,#02_img/king3.png" width="35%" style="display: block; margin: auto;" /> --- class: animated, fadeIn ## Balance entre grupos <img src="data:image/png;base64,#02_img/king_base.png" width="75%" style="display: block; margin: auto;" /> --- class: animated, fadeIn ## Estimando el ATE - Podemos estimar el ATE con una simple regresión lineal: -- `\(Y_i = \alpha + \delta D_i + \varepsilon_i\)` -- - Donde `$$\begin{align*} \delta & = E(Y_{1i}|D_i =1) - E(Y_{0i}| D_i=0)\\ &= E(Y_{1i}) - E(Y_{0i})\\ & = \Delta^{ATE} \end{align*}$$` -- - La segunda igualdad viene de la aleatorización de `\(D_i\)` --- class: animated, fadeIn ## Resultados <img src="data:image/png;base64,#02_img/king4.png" width="80%" style="display: block; margin: auto;" /> --- class: animated, fadeIn ## Resultados <img src="data:image/png;base64,#02_img/king5.png" width="80%" style="display: block; margin: auto;" /> --- class: animated, fadeIn ## Resultados <img src="data:image/png;base64,#02_img/king6.png" width="45%" style="display: block; margin: auto;" /> --- class: animated, fadeIn ## Resultados <img src="data:image/png;base64,#02_img/king7.png" width="75%" style="display: block; margin: auto;" /> --- class: animated, fadeIn ## Conclusiones <br> - Discusión final 1. El tratamiento tiene un impacto en afiliar a casi el 44% de la población elegible 2. Los efectos muestran que el SP reduce GBS para consultas ambulatorias y hospitalarias 3. Efectos mucho más notorios en población más pobre 4. No hay efectos en gasto en medicamentos --- class: animated, fadeIn ## Diseño de experimentos sociales <br> - Hay alternativas en la forma de aleatoizar -- - Pueden haber externalidades - Puede variar el nivel de aleatorización - Estratificación - Cálculos de poder estadÃstico --- class: animated, fadeIn ## Externalidades - Hasta ahora asumimos que no hay "contaminación" entre individuos - Stable Unit Treatment value Assumption (SUTVA) - Asume que el hecho de una persona sea tratada no afecta los resultados de otra persona -- ¿Qué pasa si hay redes sociales fuertes? - Es importante considerar esto y ver cómo se puede controlar. -- - Por ejemplo, ¿qué implica este supuesto para el caso de King at el. (2009)? -- - Recuerde que el SP fue aleatorizado a nivel de comunidad - ¿Por qué SUTVA serÃa complicado si el tratamiento fuese asignado nivel individual en este caso? --- class: animated, fadeIn ## Nivel de aleatorización <br> - En algunos casos se aleatoriza a nivel individual y en otros casos a un nivel más agregado (colegios, comunidades, consultorios) - ¿Porqué hay diferencia en niveles de aleatorización? - Reducir externalidades o contaminación: ej., SUTVA es más probable si aleatorizamos a nivel de comunidad que a nivel individual - Aspectos éticos: Es más fácil tener grupos controlados a nivel de comunidad que separar tratamiento y control a nivel de comunidad. --- class: animated, fadeIn ## Resumen: Experimentos I <br> - Los datos experimentales resuelven el problema de selección que encontramos para tener estimadores validos de los efectos del tratamiento. -- - Los experimentos permiten a los tomadores de decisiones polÃticas (públicas) de observar efectos de nuevos tratamientos que no han sido revelados anteriormente. -- - Los resultados son convincentes y fáciles de explicar ya que son diferencias medias. -- - El diseño es crucial en un experimento: nivel de aleatorización, unidad de análisis, etc. --- name: vi class: inverse middle center animated, fadeIn ## 6. Variables Instrumentales --- class: animated, fadeIn ## Variables instrumentales **La visión tradicional** - Repasemos el modelo de regresión lineal estándar: `$$Y_i= \delta D_i + X_i\beta+\epsilon_i$$` - Dónde `\(Y_i\)` es la variable de resultado, `\(D_i\)` es la variable de interés, y `\(X_i\)` es un vector de controles que incluye una constante y dónde `\(cov(X,\epsilon)=0\)` - Si `\(Cov(D,\varepsilon) \neq 0\)` entonces decimos que ... -- `\(D\)` es endogeno y estimadores MCO... -- ¿?es sesgado e inconsistente. -- - Esto puede ocurrir por distintas razones: variable omitida, error de medición, simultaneidad, sesgo de selección, etc. --- class: animated, fadeIn ## Variables instrumentales <br> - Podemos pensar en la variable `\(D\)` cómo: - `\(D_i= B_i\varepsilon_i + C_i\)` - Dónde `\(cov(C,\varepsilon)=0\)` Reemplazando en la regresión anterior tenemos que: - `\(Y_i= \delta C_i + X_i \beta + \underbrace{(1-\delta B_i)\varepsilon_i}_{v_i}\)` - Si observáramos los componentes de `\(D_i\)` podrÃamos correr una regresión de `\(Y\)` sobre `\(C\)` y obtener `\(\delta\)` - Pero en la realidad no observamos los componentes de `\(D_i\)`. Lo mejor que podemos hacer es buscar una variable instrumental. --- class: animated, fadeIn ## Variables instrumentales <br> - La idea detrás de IV es la de encontrar una variable que este correlacionada con `\(C\)` (la parte exógena de `\(D\)`) pero no correlacionada con `\(\varepsilon\)` - Entonces `\(Z\)` es un instrumento para `\(D\)`, cuando: - Restricción de exclusión: `\(Cov(Z,\varepsilon)=0\)`. Condicionando en `\(D\)` y `\(X\)`, `\(Z\)` no está correlacionada con `\(\varepsilon\)` - Condición de instrumento: `\(Cov(Z,D)\neq0\)`. `\(Z\)` está correlacionada con `\(D\)` - Con estas dos condiciones podemos usar MCO en dos etapas para estimar `\(\delta\)` --- class: animated, fadeIn ## Variables instrumentales <img src="data:image/png;base64,#02_img/iv1.png" width="50%" style="display: block; margin: auto;" /> - La restricción de exclusión afirma que `\(Z\)` afecta a `\(Y\)` sólo a través de `\(D\)`. `\(Z\)` no puede afectar `\(Y\)` a través de otros canales y opor eso se "excluye" de la regresión de `\(Y\)` sobre `\(D\)`. --- class: animated, fadeIn ## MCO en 2 etapas <br> - En la primera etapa estimamos una regresión de la variable endógena `\(D\)` con todas las variables exógenas `\(X\)` incluyendo `\(Z\)`: **1E** `\(D_i=\alpha Z_i + X_i \lambda + v_i\)` - Predecimos los valores de `\(D_i\)` en esta regresión, `\(\hat{D}_i\)`. - En la segunda etapa, estimamos una regresión de la variable de resultado sobre el valor predicho `\(\hat{D}_i\)`. y las otras `\(X\)` **2E** `\(Y_i=\delta \hat{D}_i + X_i \beta + \varepsilon_i\)` - `\(\hat{\delta}\)` es el estimador de IV --- class: animated, fadeIn ## Asignación aleatoria como IV <br><br><br><br> - En clase --- class: animated, fadeIn ## Ejemplo **Angrist (1990)** <img src="data:image/png;base64,#02_img/iv2.png" width="75%" style="display: block; margin: auto;" /> --- class: animated, fadeIn ## Ejemplo: Efecto de Servicio Militar sobre Salud y Salarios - Muchos programas en EE.UU ofrecen servicios de salud, educación, capacitación a veteranos de guerra en parte para compensar por las desventajas a las que estuvieron expuestos por ir a la guerra o al servicio militar -- - Por ir al servicio, tienen menos años de experiencia laboral y no reciben la misma compensación que otros no veteranos(as) de la misma edad. -- - La **pregunta de investigación** de esos estudios es: ¿Cuál es el efecto del servicio militar sobre la salud y salarios de los veteranos? -- - La **pregunta de polÃtica pública** es: ¿Son los veteranos compensados de manera adecuada? -- **Discusión en clase**: ¿Por qué creen que serÃa difÃcil estudiar etas preguntas mediante un simple MCO? --- class: animated, fadeIn ## Usando la selección mediante loterÃa cómo instrumento - El Departamento de Defensa de EE.UU implementó cinco loterÃas para la guerra de Vietnam en 1970 a 1975 enfocadas en hombres de 19-20 años. - La de 1970 se enfoco en hombres nacidos en 1950; la de 1971 en hombres de 1951,... - En las loterÃas, se asignaron Número aleatorios mediante un muestreo aleatorios de cumpleaños y enumerándolos del 1 al 365 - Se seleccionaron puntos de corte para cada año y todo aquél por debajo del corte fue seleccionado para ir a la guerra - 1970: RSN 195, 1971: RSN 125, 1972: RSN 95 - Angrist construye el siguiente instrumento `\(Z\)`: `\(ELIG_i = 1\)` si `\(RSN< c\)`, y `\(=0\)` en caso contrario. -- ¿Que quiere instrumentar Angrist? -- El hecho de que un hombre haya ido o no al servicio militar --- class: animated, fadeIn ## Primera etapa <img src="data:image/png;base64,#02_img/iv3.png" width="70%" style="display: block; margin: auto;" /> --- class: animated, fadeIn ## Segunda etapa <img src="data:image/png;base64,#02_img/iv4.png" width="70%" style="display: block; margin: auto;" /> --- class: animated, fadeIn ## Efectos de largo plazo <img src="data:image/png;base64,#02_img/iv5.png" width="40%" style="display: block; margin: auto;" /> --- class: animated, fadeIn ## Efectos en salud <img src="data:image/png;base64,#02_img/iv6.png" width="90%" style="display: block; margin: auto;" /> - Hombres blancos nacidos en 1950 que fueron a Vietnam por la loterÃa tuvieron una probabilidad de 0.56% mayor de morir luego de la guerra --- class: animated, fadeIn ## Un check list para la estimación de IV <br> - ¿Es el supuesto de asignación aleatoria válido para el caso de Vietnam? -- - Si, las loterÃas fueron esencialmente aleatorias -- - ¿Cómo es la restricción de exclusión en este caso? -- - Se invalidarÃa si es que salarios o salud de los hombres con bajo RSN se vieran afectados de alguna otra forma distinta a su participación en la guerra. ¿Hay algún ejemplo en que esto pase? -- **DifÃcil** --- class: animated, fadeIn ## Un check list para la estimación de IV <br> - ¿Cómo es la condición de instrumento en este caso? ¿Hay relación entre la loterÃa e ir a la guerra? -- - Si, los datos muestran que aquellos con RSN bajo el corte tienen mayor probabilidad de ir a la guerra -- - ¿Cómo es la restricción de exclusión en este caso? -- - Se invalidarÃa si es que salarios o salud de los hombres con bajo RSN se vieran afectados de alguna otra forma distinta a su participación en la guerra. ¿Hay algún ejemplo en que esto pase? -- **DifÃcil** --- name: despedida class: inverse, center, middle background-image: url(data:image/png;base64,#02_img/logo-uc.png) background-position: 50% 10% background-size: 10%, cover <br><br><br> ## Semana 3 ### Introducción a Inferencia Causal 07 de octubre, 2022 <div class="my-footer"></div>
<b>Pablo A. Celhay</b> | [
pacelhay@uc.cl](mailto:pacelhay@uc.cl) .left[.footnote[ <br> Diseño y formato de la presentación:
José Daniel Conejeros | [
jdconejeros@uc.cl](mailto:jdconejeros@uc.cl) | [
JDConejeros](https://github.com/JDConejeros) ]]